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摘要 : [目的 /意义 ] 对 KRDS 模型 的 理论 和 实践 进行 调研 分 析 , 为 我 国 开展 科学 数据 管理 提供 指导 和 借 
X, [ 方法/ 过程] 通过 文献 调研 网 络 调研 ,对 JJSC 资助 的 KRDS 模型 和 基于 该 模型 的 国外 高 校 科 学 数据 管理 
实践 进行 总 结 , 详 细 解 析 KRDS 模型 在 科学 数据 管理 成 本 分 析 中 的 应 用 ,得 出 对 我 国 开展 科学 数据 管理 的 局 
To [结果 /结论 ]KRDS 模型 是 一 个 通用 的 、 系 统 的 架构 ,基于 KRDS 对 科学 数据 管理 成 本 进行 分 析 , 能 比较 完 
整地 涵盖 和 预测 到 各 个 管理 环节 。KRDS 模型 可 为 我 国 开展 科学 数据 管理 提供 参考 方向 ,规范 管理 流程 , 细 化 
管理 成 本 和 收益 。 
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以 数据 密集 型 计算 为 特征 的 科学 研究 第 四 范式 正 。 科学 数据 管理 ,目的 是 帮助 机 构 识 别 、 理 解 . 评 估 数 字 
在 兴起 ,科学 数据 成 为 支撑 科研 发 现 的 重要 资源 , 越 来 ”资源 管理 成 本 和 收益 。 此 外 还 有 一 些 已 经 比较 成 熟 的 
越 多 的 机 构 和 组 织 开始 进行 科学 数据 的 管理 工作 ,以 ”数字 资源 长 期 保存 成 本 评估 模型 ,例如 荷兰 国家 档案 
月 效 支 撑 基 于 数据 的 知识 发 现 。 从 科学 数据 管理 的 具 — 02005 年 提出 了 T-CMDP 模型 六 , 主要 针对 电子 表 
体操 作 来 看 ,科学 数据 管理 是 一 系列 围绕 科学 数据 的 。 Hs .邮件 等 类 型 的 数据 ,成 本 核算 时 间 跨 度 仅 涉及 现在 
活 训 总 和 ,包括 数据 的 组 织 .备份 ,存档 共享. 出 版 和 和 未 来 ; 美 家 航空 航天 局 在 2008 年 改进 了 其 
安 从 管理 等 ,这 些 活动 保障 了 科学 数据 的 使 用 和 再 利 NASA-CET 模型 后 ,侧重 于 空间 和 多 维 数据 的 保存 与 
有 愤 征 支撑 基于 数据 的 科学 发 现 的 重要 基础 ”。 对 这 ”管理 ;以 及 伦敦 大 学 和 英国 图 书馆 2010 年 提出 的 
些 笠 学 数据 管理 活动 的 成 本 以 及 可 能 产生 的 收益 进行 。 LIFE3 EUIS , 它 尤 其 适用 于 图 书 、 报 纸 等 电子 资源 管 
人 研 宪 和 分 析 , 有 助 于 我 们 更 加 有 效 地 开展 科学 数据 管 。 理 成 本 对 象 , 且 部 分 涉及 成 本 核算 的 固定 值 来 自 对 图 
理 5 保 障 科 学 数据 管理 的 可 持续 性 ,为 我 国 开展 科学 数 资源 的 实证 调研 ,缺乏 适用 性 等 。 其 中 ,由 英国 联合 
据 管理 活动 提供 参考 和 借鉴 。 言 息 系 统 委 员 会 (Joint Information Systems Committee 

国外 已 有 机 构 开展 科学 数据 管理 成 本 的 研究 和 实 。 (JISC) ) 资 助 的 KRDS ( Keeping Research Data Safe) 模 
践 工作 。A. S. Palaiologk 等 利用 作业 成 本 法 分 析 了 荷 。 型 ,支持 多 种 学 科 类 型 的 科学 数据 管理 成 本 和 收益 
兰 数据 存档 与 网 络 服务 ( Data Archiving and Networked — 核算 ,成 本 核算 时 间 跨 度 长 (过 去 、 现 在 与 未 来 ) ,成 本 
Services( DANS) ) 的 科学 数据 管理 和 长 期 保存 成 本 ， ”驱动 因素 划分 相对 合理 全 面 ,同时 还 弥补 了 收益 分 析 
该 方法 侧重 于 将 影响 科学 数据 管理 成 本 的 因素 划分 为 。 方面 的 缺失 , 故 本 文选 取 KRDS 模型 作为 研究 对 象 。 
人 力 成 本 和 非 人 力 成 本 ,再 藉 由 作业 活动 分 解 成 本 驱 国内 的 研究 主要 集中 于 数字 资源 长 期 保存 成 本 与 
动因 素 。 欧 洲 社会 科学 数据 档案 联盟 (Consortium of ”收益 的 研究 。 例 如 苏 小 波导、 肖 英 中 等 对 数字 资源 保 
European Social Science Data Archives( CESSDA ) ) 开发 存 的 成 本 驱动 因素 进行 了 分 析 ; 杨 稚 林 5 EARS 
了 社会 科学 数据 管理 和 长 期 保存 的 成 本 - 收益 分 析 工 ”等 对 图 书馆 数字 资源 保存 中 的 成 本 与 效益 关系 进行 分 
具 包 ( Cost-Benefit Advocacy Toolkit)” , 它 侧重 于 社会 WIE AAA 、 李 海 涛 '“ 等 对 各 种 国外 已 经 
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成 熟 的 数字 资源 保存 成 本 模型 进行 比较 了 分 析 与 评 
价 。 其 研究 对 象 是 广义 的 数字 资源 ,包括 科技 文献 . 科 
学 数据 音频、 视频 等 。 专 门 以 科学 数据 为 研究 对 象 ， 
通过 对 科学 数据 管理 活动 的 分 析 来 进行 科学 数据 管理 
成 本 - 效益 的 研究 尚未 见 到 。 

数据 密集 型 科研 范式 下 ,科学 数据 管理 成 为 大 多 
数 科研 机 构 的 常规 活动 ,对 科学 数据 管理 的 成 本 效益 
进行 分 析 ,能 够 帮助 我 们 识别 科学 数据 管理 中 的 关键 
活动 ,促进 机 构 开 展 高 效 的 科学 数据 管理 。 本 文 以 此 
为 切入 点 ,通过 比较 国外 已 有 的 科学 数据 管理 成 本 收 
益 实 践 与 模型 (前 文 已 述 ) ,选取 JISC 资助 的 专门 应 对 


KRDS 模型 基于 生命 周期 成 本 法 来 分 析 科 学 数据 
管理 的 成 本 活动 ,通过 确定 生命 周期 中 科学 数据 管理 
成 本 活动 .成 本 驱动 因素 (影响 活动 成 本 的 变量 ,如 数 
Ti .格式 等 ) 和 资源 (员工 时 间 \ 设 备 等 ) ,构建 综合 的 
成 本 核算 框架 ,帮助 管理 机 构 理 解 .识别 .分 析 管 理 活 
动 中 的 成 本 ,同时 它 还 提醒 管理 者 进行 收益 分 析 和 建 
立 相关 价值 链 。 该 模型 经 历 了 三 个 发 展 时 期 :第 一 期 
(KRDSI ) 完成 于 2008 年 ,该 阶段 建立 了 成 本 分 析 模 型 
的 主体 ,探讨 了 构成 科学 数据 管理 成 本 的 主要 因素 ;第 
二 期 (KRDS2 ) 完成 于 2009 年 ,对 模型 进行 了 修改 和 优 
化 ,识别 并 分 析 了 与 长 期 数据 保存 有 关 的 收益 因素 ;第 


科学 数据 管理 成 本 - 收益 分 析 的 KRDS 评价 模型 为 调 
研 和 分 析 对 象 。 该 模型 具有 支持 多 类 型 科学 数据 管理 
成 杰 — 收益 分 析 , 成 本 驱动 因素 全 面 ,时 间 跨度 长 , 适 
用 怪 强 ,能 够 为 国内 的 相关 应 用 提供 清晰 的 思路 等 特 
点 合 通 过 文献 调研 .网络 调研 的 方法 ,通过 对 KRDS 项 
b 产 出 报告 ,包括 Keeping Research Data Safe 
(CRRDsI ye Research Data Safe 2 
( KRDS2 ) .DS2/KRDS Benefits Analysis Tools Pro- 
tD PI X, Keeping Research Data Safe 2 ( KRDS2) Pro- 
ebsite [3l ^ 的 调研 ,以 及 KRDS 模型 在 各 高 校 
的 砚 用 报告 ,例如 剑桥 大 学 "1 eSI E SE I ,南安 
其 议 大 学 "等 高 校 应 用 KRDS 模型 的 项 目 报告 ,结合 
相 美 研究 论文 ,从 构成 要 素 .成 本 驱动 因素 .成 本 核算 
框 次 ,收益 分 析 框 架 、 应 用 实践 等 多 维度 深度 解析 
KRDS 模型 。 希 望 能 够 洞悉 KRDS 科学 数据 管理 成 本 
< 收益 模型 ,解析 构成 科学 数据 管理 成 本 的 主要 活动 ， 


总 铺 影 响 科 学 数据 管理 成 本 的 驱动 因素 ,归纳 该 模型 


的 应 用 程序 ,为 我 国 开展 科学 数据 管理 成 本 和 收益 分 
析 提 供 参 考 。 


1 KRDS 模型 概述 


1.1 KRDS 模型 发 展 历程 

KRDS 模型 是 由 JISC 资助 的 关于 评估 科学 数据 管 
理 和 保存 成 本 与 收益 的 项 目 成 果 , 主 要 用 于 帮助 机 构 
识别 和 确定 科学 数据 管理 与 保存 的 成 本 ,并 使 其 意识 
到 管理 和 保存 活动 会 带 来 的 收益 。 该 项 目 通 过 调查 和 
人 研究 高 等 教育 机 构 Higher Education Institutions 
(HEIs) ) 在 科学 数据 管理 和 保存 方面 的 中 长 期 成 本 与 


Keeping 


三 期 主要 是 对 成 本 收益 模型 与 工具 进行 推广 和 使 用 ， 
将 研究 成 果 转向 实践 领域 ” 。 
1.2 KRDS 模型 的 构成 

KRDS 模型 主要 由 三 部 分 构成 :作业 模型 ,成 本 驱 
动因 素 以 及 成 本 核算 框架 ( 见 图 1 ) 。 作 业 模 型 用 于 识 
别 具 有 成 本 影响 的 科学 数据 管理 活动 ,并 将 它们 排列 
到 一 个 分 为 作业 、 子 作业 的 层次 结构 中 ;KRDS 成 本 驱 
动因 素 , 即 关 键 变量 (例如 工资 水 平 或 通货 膨胀 率 ) ， 
它们 影响 保存 活动 的 成 本 。 成 本 驱动 因素 分 为 两 大 
类 :经 济 调整 和 服务 调整 ;KRDS 成 本 核算 框架 将 成 本 
(员工 或 设备 等 ) 和 作业 持续 时 间 (1 年 ,2 年 等 ) 联 结 
起 来 ,形成 一 种 接近 于 透明 成 本 核算 法 ( Transparent 
Approach to Costing ( TRAC) ) 的 综合 成 本 核算 模型 。 
TRAC 广泛 应 用 于 英国 的 165 所 高 等 教育 机 构 ,用 来 核 
算 高 校 的 教学 科研 以 及 其 他 主要 活动 的 经 费 ”。 


识别 科学 数据 管理 将 作业 模型 和 成 本 驱动 整合 成 
活动 中 的 成 本 分 配 一 个 接近 TRAC 的 成 本 核算 模型 


c—— 


服务 调整 ， 科学 数据 管理 过 程 中 必须 要 考虑 的 一 些 因素 
经 济 调整 : 影响 科学 数据 管理 成 本 的 经 济 变量 


1 KRDS 模型 构成 


KRDS 作业 模型 有 助 于 识别 消耗 资源 的 活动 ;成 本 驱 
动因 素 能 够 帮助 科学 数据 管理 机 构 识 别 作业 活动 中 影响 
成 本 的 经 济 变量 ,以 及 管理 和 服务 过 程 中 必须 要 考虑 的 一 
些 因 素 ,例如 数据 格式 等 ,这 些 变量 最 终 需 要 数据 管理 机 


收益 情况 ,开发 了 相关 的 理论 工具 方法 ,就 有 关 问 题 
对 英国 高 等 教育 基金 会 (Higher Education Funding 
Council for England( HEFCE) ) 和 机 构 进 行 了 指导 ,保证 
了 科学 数据 管理 的 可 持续 性 发 展 。 
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构 与 数据 提交 方 协商 确定 ;成 本 核算 框架 将 作业 模型 和 成 
本 驱动 因素 联结 在 一 起 ,方便 机 构 进 行 学 习 、 参 照 和 成 本 
核算 。 由 此 ,数据 保管 机 构 便 可 根据 KRDS 模型 ,结合 


d, 刘 盼 移 . KRDS 科学 数据 管理 成 本 - 收益 模型 调研 与 分 析 [J]. 图 书 情报 工作 ,2018 ,62(24) :93 - 103. 


地 情况 ,识别 消耗 资源 的 管理 活动 ,确定 成 本 驱动 因素 ， 
核算 和 分 析 整 个 科学 数据 管理 过 程 中 的 成 本 。 


2 KRDS 作业 模型 和 成 本 驱动 因素 


2.1 作业 模型 

科学 数据 管理 是 科研 人 员 所 从 事 的 对 科学 数据 的 
管理 活动 ,这 些 活 动 消耗 资源 ,产生 成 本 ,这 些 成 本 构 
成 了 科学 数据 管理 的 成 本 。 因 此 ,识别 科学 数据 管理 
的 行为 和 活动 ,是 厘清 科学 数据 管理 成 本 的 首要 步 又 。 
KRDS 作业 模型 就 是 用 于 识别 科学 数据 管理 活动 的 工 
具 , 它 由 一 套 层次 结构 组 成 ,包括 预 归 档 、 归 档 两 个 活 
动 阶段 ,以 及 附加 的 支持 服务 和 物业 管理 。 预 存档 阶 


图 2 KRDS 


KRDS 作业 模型 将 科学 数据 保存 管理 活动 分 为 两 
个 阶段 :预存 档 阶 段 和 存档 阶段 ,以 及 配套 的 支持 服务 
和 物业 管理 。 预 存档 阶段 主要 负责 创建 科学 数据 及 将 
其 转换 为 数据 存档 ,其 中 要 考虑 到 如 数据 格式 .元 数据 
等 影响 数据 生成 和 获取 的 因素 ,为 此 就 要 指定 相关 的 
数据 保存 和 共享 计划 ,生成 关于 数据 的 描述 性 信息 、 用 
户 文档 ,并 与 数据 创建 者 协商 所 使 用 的 格式 和 逻辑 结 
构 等 ,此 外 管理 机 构 还 会 为 数据 提交 者 和 创建 者 提供 
存档 训练 和 支持 。 

存档 阶段 是 科学 数据 长 期 管理 的 主要 阶段 ,初始 
阶段 要 制定 相关 的 数据 选择 政策 ,与 数据 创建 者 协商 
提交 协议 ;之 后 会 将 数据 转移 到 知识 库 或 保管 机 构 ,并 
安全 销毁 没有 被 选中 进行 长 期 管理 的 数据 ;数据 管理 
机 构 会 提供 适当 的 存储 容量 和 设备 来 接收 数据 ,并 将 
数据 格式 转换 为 存档 所 需 的 格式 ;在 数据 保存 归档 的 


段 涉 及 所 有 与 数据 创建 和 管理 相关 的 活动 ,这 些 活动 
是 在 存档 之 前 。 存 档 阶段 包括 一 系列 将 科研 数据 归档 
到 由 高 校 或 其 他 机 构 运 行 的 档案 存储 库 中 的 活动 。 这 
两 个 阶段 都 与 科学 数据 的 生命 周期 成 本 有 关 。 支 持 服 
务 包含 的 活动 可 以 支持 预存 档 或 存档 阶段 的 活动 , 它 
们 通常 是 关于 财务 IT 和 其 他 公共 服务 的 基础 设施 。 
而 物业 管理 则 包含 对 建筑 物 和 其 他 基础 设施 的 管理 。 

KRDS 作业 模型 基于 对 LIFE NASA CET OAIS 和 
TRAC 模型 的 研究 与 分 析 ,经 过 不 断 地 修改 和 扩展 ,从 
KRDSI 演化 到 KRDS2。KRDS 作业 模型 的 细 分 列表 如 
2 Biz s 


制定 保存 战略 和 标 
TES 制定 信息 包 策 
划 和 迁移 计划 ; 制 
定 和 监控 外 包 保 存 
的 服务 级 别 协议 


进行 长 期 保存 ， 生 
成 保存 元 数据 


作业 模型 


过 程 中 ,会 生成 相关 的 管理 元 数据 、 描 述 性 元 数据 、 用 
户 文档 等 ,并 且 会 提供 可 以 更 新 归档 文件 内 容 的 机 制 
以 及 原始 数据 文本 解释 的 语义 链接 ;在 数据 归档 管理 
时 ,要 维护 数据 完整 性 ,及 时 增 改 和 删除 信息 ; 当 用 户 
进行 访问 和 查询 请 求 时 ,能 够 实时 为 用 户 生成 结果 集 、 
报告 并 提供 相关 培训 和 帮助 。 在 数据 创建 ,管理 和 共 
享 等 过 程 中 ,要 保持 与 数据 消费 者 .生产 者 的 交互 ,以 
跟踪 需求 和 技术 的 变化 ,随时 更 新 保管 技术 和 策略 ,新 
的 保存 技术 工具、 标准 的 开发 ,需要 各 个 机 构 共 同 参 
与 开发 和 制定 。 

支持 服务 需要 行政 人 员 提 供 日 常 的 支持 与 控制 ， 
建立 和 维持 数据 保管 标准 与 政策 ;此 外 还 需要 提供 数 
据 平 台 的 软件 接口 ,分布 式 应 用 程序 .不 间断 的 水 电 资 
源 日常 办 公 消 耗 品 和 人 员 培 训 与 发 展 等 。 物 业 管 理 
和 服务 费用 则 涉及 房屋 租赁 .空间 管理 和 维修 ,在 
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KRDS 模型 中 ,根据 功能 的 不 同 ( 如 实验 室 / 非 实验 影响 科学 数据 管理 成 本 。KRDS 模型 中 将 这 些 变量 分 
室 ) ,将 其 归 为 与 其 他 公共 服务 分 离 的 成 本 因素 ,并 按 ”为 两 类 , 即 经 济 调整 类 和 服务 调整 类 。KRDS 模型 列 
可 变 利率 核算 费用 。 出 这 些 成 本 驱动 因素 ” ,帮助 科学 数据 管理 机 构 在 进 

这 些 科 学 数据 管理 活动 ,消耗 人 力 资源 、 资 本 资 。 行 成 本 分 析 时 ,识别 管理 活动 中 会 影响 成 本 的 变量 , 通 
产 ,存档 过 程 中 相关 的 数据 量 数据 格式 等 因素 会 影响 ”过 具体 变量 的 调整 和 变化 来 核算 资源 的 消耗 .成 本 和 
资源 的 使 用 情况 ,从 而 影响 成 本 。 管 理 机 构 可 以 借助 ” 收益 。 


该 作业 模型 识别 管理 活动 ,为 进一步 分 析 成 本 做 准备 。 (1) 一 般 要 素 。 在 进行 各 活动 阶段 具体 成 本 变量 
2.2 成 本 驱动 因素 的 识别 之 前 ,KRDS 首先 确定 了 那些 会 对 管理 成 本 产 


为 了 进行 成 本 核算 ,保管 机 构 在 明确 管理 活动 后 ， ” 生 整 体 性 影响 的 因素 , 它 把 这 些 因素 统称 为 一 般 要 素 。 
需要 确定 成 本 的 驱动 因素 ,这 些 因 素 以 及 其 调整 和 变 。 这 将 有 助 于 识别 后 续 具 体 活动 阶段 的 成 本 变量 。 一 般 
化 会 通过 资源 与 资产 的 消耗 而 导致 成 本 的 产生 和 变 ”要 素 在 表 1 中 列 出 : 

动 。 成 本 驱动 因素 包括 多 种 不 同 的 变量 ,这 些 变量 能 


表 1 一 般 要 素 
T 一 般 要 素 说 明 


数 匾 集 等 级 和 保存 目标 高 等 教育 机 构 的 多 数 数据 集 仅 供 项 目 团队 使 用 ,有 时 也 只 用 于 极 少数 外 部 用 户 。 保 存 目标 是 保证 
《人 科研 数据 能 持续 安全 存储 ,并 且 有 足够 的 描述 性 信息 ,以便 数据 恢复 。 
通过 限制 一 些 服 务 调整 类 因素 ,机构 可 以 控制 未 来 成 本 的 复杂 性 和 不 可 预测 性 。 

在 预存 档 阶段 中 生成 描述 性 元 数据 和 用 户 文档 ,而 不 是 在 存档 的 摄取 活动 中 生成 新 的 /升级 不 足 
的 元 数据 和 文档 ,对 于 节省 成 本 尤其 重要 。 

RA cb SERAI EORR" 上 面 的 行动 时 机 是 成 本 依赖 的 一 个 例子 ,任何 保存 科学 数据 成 本 模型 都 要 考虑 到 它 的 存在 。 
Et 时 间 调度 的 敏感 性 人 力 资源 不 易 快速 地 适应 总 存储 量 的 变化 ,或 工作 负荷 的 短期 波动 ,特别 是 保管 机 构 对 数据 资料 
A 何 时 到 达 或 处 理 速度 几乎 没有 控制 能 力 时 。 
ww 
( 架 疮 技术 的 发 展 和 商用 现货 的 可 获得 性 (COTS) 或 成 熟 技术 的 发 展 和 商用 现货 的 可 获得 性 或 成 熟 的 开源 软件 应 用 在 不 同 的 生命 周期 阶段 中 都 将 对 成 本 
社区 标准 和 最 佳 实践 (“ 先 发 创 新 ” ) 产生 重大 影响 。 通 常 ,这 些 开发 适合 于 外 部 资助 和 协作 来 完成 。 在 作业 模型 中 ,这 被 作为 先 发 创 

新 阶段 的 一 部 分 。 


经 济 调整 和 服务 调整 。KRDS 模型 将 一 系列 理 \ 保 存 过 程 中 ,各 个 作业 阶段 在 提供 服务 或 要 求 时 ， 
上 基体 成 本 驱动 因素 分 为 经 济 调整 和 服务 调整 两 类 。 经 ”必须 要 考虑 的 一 些 因素 ,例如 数据 量 、 存 储 格 式 、 用 户 
济 滑 整 类 的 成 本 驱动 因素 主要 是 指 影响 科学 数据 管理 数量 等 等 。 科 学 数据 管理 机 构 需 要 在 进行 存档 活动 之 
成 条 的 经 济 变量 , 当 它们 发 生变 化 时 ,一 系列 资源 和 资 。 前 制定 相关 标准 和 预期 ,使 得 数据 提交 方 能 够 按 标 准 
产 的 成 本 核算 就 会 随 之 变动 。 例 如 ,通货 膨胀 率 、 投 资 。 规章 和 流程 提交 数据 ,以 便 核算 成 本 并 确保 后 续 的 保 
回报 率 等 。 管 理 机 构 要 与 数据 提交 方 商定 这 些 变量 ， ” 存 服务 。 表 2 列 出 了 经 济 调整 和 服务 调整 两 类 成 本 驱 
以 便 之 后 的 成 本 核算 。 SR : 

服务 调整 类 的 成 本 驱动 因素 则 是 指 在 科学 数据 管 

表 2 影响 科学 数据 管理 成 本 的 变量 


分 类 作业 阶段 变量 
经 济 调整 通货 膨胀 /通货 紧缩 ;折旧 ;融资 和 投资 的 回报 
服务 调整 通用 类 人 力 成 本 和 劳动 率 ; 作 业 持 续 时 间 ; 启 动 和 作业 操作 阶段 ;自动 化 的 水 平 
获取 、 处 理 和 摄取 用 户 数量 ;储存 的 数量 ,方式 和 频率 ;文件 格式 的 数量 .复杂 性 和 类 型 ;数据 量 ; 元 数据 文档、 伦理 和 知识 产权 ; 


处 理 、 验 证 和 校准 的 级 别 ;取消 访问 成 本 
存档 存储 、 保 存 规划 ,数据 管理 。 保留 期 ;管理 和 更 新 ;版 本 和 副本 的 数量 ;存储 介质 ( 容量, 成本) ;存档 介质 监测 
访问 用 户 和 用 户 社区 的 数量 ;标准 或 自 定 义 接 口 ;用 户 支持 的 水 平 ; 访 问 控制 ;访问 的 数量 和 容量 /体积 ;访问 /分 配 
方法 ;服务 响应 时 间 ; 加 工 过 的 产品 


(1) 经 济 调整 。 经 济 调整 类 因素 需要 管理 机 构 、 ”适用 于 一 些 设备 类 的 成 本 核算 ;折旧 的 计算 通常 是 依 
数据 提交 方 以 及 资助 机 构 进 行 协商 确定 。 通 货 膨 胀 率 ” 据 时 间 的 推移 或 资产 的 活跃 (或 使 用 ) 水 平 ;而 融资 和 
通常 适用 于 诸如 员工 等 成 本 的 核算 ;通货 紧缩 率 通常 。 投资 的 回报 则 包括 融资 成 本 和 最 低 限 度 的 保留 一 余 。 
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它们 的 变化 将 会 影响 一 系列 资源 .资产 的 成 本 核算 ,从 
而 确定 经 济 类 变量 变 得 尤其 重要 。 

(2) 服务 调整 。 在 所 有 作业 活动 中 ,尤其 要 注意 
人 力 成 本 , 它 应 包括 工资 .保险 和 养老 金 (退休 人 金 ) ,该 
成 本 是 科学 数据 管理 活动 中 的 主要 成 本 。 在 案例 研究 
中 ,管理 活动 的 70% 甚至 更 多 的 成 本 与 人 力 成 本 有 
关 , 而 从 历史 上 看 ,这 些 费 用 一 直 被 视 为 管理 成 本 的 主 
要 组 成 部 分 。 也 因为 员工 成 本 的 重要 性 ,自动 化 水 平 
对 总 成 本 来 说 就 是 一 个 重要 变量 , 它 的 影响 程度 将 取 
决 于 其 可 实现 的 规模 经 济 。 当 然 ,为 了 能 够 获得 和 模 
拟 通货 膨胀 /通货 紧缩 的 费用 和 调整 成 本 ,还 需要 记录 
作业 的 持续 时 间 。 除 此 之 外 ,在 不 同 的 活动 阶段 成 本 
的 侧重 类 型 也 会 不 同 ,例如 在 启动 阶段 强调 安装 系统 
基础 设施 的 固定 成 本 ,而 在 后 续 作业 阶段 则 强调 随时 
间 惧 移 运 行 容量 的 可 变 成 本 。 
1 操 在 获取 、 处 理 和 摄取 阶段 要 特别 注意 存档 文件 格 
式 酌 专 有 性 将 会 对 成 本 产生 很 大 影响 , 韭 专 有 格式 可 
届 化 获取 和 迁移 程序 ,降低 管理 风险 和 成 本 。 对 于 


A E 要 的 因素 就 是 支持 数据 导出 (或 导 
人 为 这 些 专 有 格式 。 此 外 ,还 要 注意 ,描述 性 元 数据 、 
俗 理 和 知识 产权 许可 的 作业 时 机 是 非常 重要 的 ,在 巴 
存档 阶段 进行 这 些 活动 会 大 大 降低 成 本 ,如 果 这 些 活 
动 要 在 存档 阶段 进行 调整 ,不 仅 会 提高 费用 ,数据 的 价 
全 天 能 也 会 显著 下 降 ;值得 注意 的 是 ,科学 数据 管理 的 
大 部 分 成 本 在 获取 和 摄取 阶段 而 不 是 在 长 期 存档 和 保 
存 除 段 。 


(在 存档 存储 、 保 存 规划 数据 管理 作业 中 ,数据 的 
保留 期 越 长 ,就 需要 更 多 的 保护 措施 ,以 确保 数据 的 完 
整 性 和 访问 性 ,因此 会 造成 更 高 的 总 成 本 。 此 外 ,服务 
水 平 也 会 影响 成 本 ,例如 吞吐 量 、 误 码 率 、 硬 件 替 换 频 
人 员 和 设备 的 利用 与 消耗 ,产生 成 本 。 在 用 户 访问 过 
程 中 ,成 本 是 潜在 地 且 变 动 性 最 大 的 阶段 。 根 据 访 问 
级 别 和 方法 的 不 同 , 成 本 是 弹性 的 ,例如 通过 网 络 访问 
和 由 工作 人 员 直 接 处 理 的 请 求 ,产生 的 成 本 将 非常 不 
同 。 此 外 ,为 了 满足 用 户 高 速 访问 和 生成 特定 数据 产 
品 等 需求 ,都 会 产生 费用 。 

基于 KRDS 的 作业 模型 ,科学 数据 管理 机 构 能 将 
其 管理 活动 清晰 化 .标准 化 ,利用 成 本 驱动 因素 列表 ， 
机 构 便 能 在 其 存档 前 识别 影响 成 本 的 变量 ,明确 或 预 
测 资 源 和 资产 的 消耗 ,完成 管理 成 本 的 预算 ,并 便于 资 
助 机 构 . 社 群 进行 投资 和 收益 分 析 。 


3 KRDS 成 本 核算 框架 


成 本 核算 框架 是 一 个 核算 科学 数据 管理 成 本 的 简 
化 而 通用 的 框架 , 它 将 KRDS 作业 模型 中 的 要 素 和 成 
本 驱动 因素 联结 在 一 起 ,为 科学 数据 管理 机 构 开 展 成 
本 核算 提供 了 便利 。 成 本 核算 框架 涵盖 了 预存 档 、 归 
档 和 支持 服务 以 及 基于 TRAC 的 成 本 类 别 , 此 外 该 杠 
架 中 还 增加 了 KRDS 模型 中 需要 明确 的 存档 费用 和 外 
包 成 本 。 通 党, 作业 模型 有 助 于 识别 管理 活动 中 所 需 
的 资源 或 资产 ;经 济 调整 类 成 本 驱动 因素 有 助 于 明确 
经 济 变量 或 运行 情况 带 来 的 成 本 变动 ,在 开展 成 本 核 
算 时 必须 要 考虑 该 类 因素 ;服务 调整 类 因素 则 有 助 于 
识别 和 调整 活动 中 具体 涉及 的 资源 变量 。 根 据 该 框架 
( 见 表 3) ,机 构 能 够 清晰 地 明确 各 个 作业 活动 中 涉及 
成 本 的 因素 和 变量 ,进而 顺利 开展 成 本 核算 。 

表 3 成 本 核算 框架 


预存 档 存档 支持 服务 持续 时 间 (1 年 .2 年 等 ) 
人 力 成 本 AIRE ”人 力 成 本 
设备 成 本 设备 成 本 ”设备 成 本 

< 旅费 差旅费 差旅费 

消耗 品 消耗 品 消耗 品 
物业 成 本 物业 成 本 ”物业 成 本 
间接 成 本 间接 成 本 外 包 

外 包 / 存 档 费用 外 包 


成 本 核算 框架 中 的 成 本 类 别 基于 TRAC 的 成 本 分 
类 方法 ,涉及 员工 .设备 旅行、 消耗 品 . 物 业 成 本 和 间 
接 成 本 。 在 完整 的 TRAC 分 类 法 中 ,员工 成 本 又 被 分 
为 直接 产生 或 直接 分 配 成 本 。 要 注意 的 是 ,KRDS Bi 
型 规定 ,在 进行 员工 和 其 他 成 本 的 核算 时 ,需要 数据 管 
理 机 构 和 资助 机 构 在 协商 后 ,将 经 济 调整 类 成 本 驱动 
因素 纳入 核算 的 考量 中 。 成 本 核算 框架 只 是 一 个 简化 
模型 ,在 具体 实践 中 ,要 根据 本 地 情况 进行 更 详实 的 划 
分 。 


4 KRDS 收益 分 析 框 架 


对 管理 科学 数据 的 成 本 进行 分 析 核 算 ,不 足以 评 
佑 特定 科学 数据 管理 活动 的 经 济 可 行 性 。 成 本 分 析 应 
该 伴随 收益 分 析 , 换 句 话说 ,就 是 在 维持 科学 数据 长 期 
存在 和 可 获得 性 时 ,还 要 预期 从 投资 中 能 产生 多 少 价 
值 。 许多 与 科学 数据 管理 有 关 的 研究 经 济 问题 的 文献 
都 集中 在 成 本 /收益 的 成 本 方面 ,对 管理 活动 为 利益 相 
关 者 所 带 来 的 收益 的 关注 相对 较 少 。 通 常 ,科学 数据 
管理 的 投资 会 带 来 收益 被 认为 是 常识 ,或 者 用 过 于 宽 
泛 的 术语 来 表达 ,从 而 限制 了 关于 收益 的 分 析 和 研究 。 
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对 未 来 科学 数据 管理 的 经 济 可 行 性 进行 分 析 , 需 
要 成 本 与 收益 相 权 衡 。 不 幸 的 是 ,衡量 收益 常常 是 相 
当 具 有 挑战 性 的 ,尤其 是 当 这 些 收 益 不 容易 量化 时 。 
作为 收益 分 析 的 第 一 步 ,制定 一 些 重要 的 维度 来 阐明 
科学 数据 管理 可 能 产生 的 收益 非常 重要 。KRDS 模型 
中 提出 了 这 样 一 种 收益 分 析 框 架 *, 它 来 自 于 对 英国 
数据 档案 .牛津 大 学 等 科学 数据 管理 机 构 的 案例 研究 ， 
从 三 个 不 同 的 维度 分 析 科 学 数据 管理 可 能 会 产生 的 收 


这 种 收益 框架 将 有 望 激励 管理 机 构 、 社 群 和 社会 对 长 
期 保存 和 管理 科学 数据 的 收益 有 更 深入 的 了 解 ,并 且 
有 助 于 阐明 成 本 /收益 等 式 的 收益 方面 。 


5 KRDS 模型 的 应 用 


目前 国外 许多 机 构 和 高 校 都 开展 了 科学 数据 管 
理 服 务 , 尤 其 是 美国 高 校 ,很 多 都 基于 KRDS 模型 进 
行 了 科学 数据 管理 的 成 本 和 收益 分 析 , 如 剑桥 大 学 、 


益 , 见 表 4。 虽 然 对 许多 收益 开展 量化 很 困难 ,但 利用 
KRDS 收益 分 析 框 架 ,至 少 能 够 让 数据 管理 机 构 对 管 
理科 学 数据 所 带 来 的 收益 有 更 加 深入 的 了 解 。 

表 4 KRDS 收益 分 析 框 架 


维度 1 
m 间接 收益 (避免 成 本) 

新 的 研究 机 会 没有 数据 的 再 创建 

侣 外交 流 / 访 问 数据 没有 丢失 未 来 的 研究 机 会 
和 位 和 再 利用 数据 更 低 的 未 来 保存 成 本 
JERAR 为 新 用 户 重新 定位 数据 
注 动 浙 网 络 /合作 重新 定位 方法 

铭记 各 产业 转移 新 用 户 的 使 

poca ttti 保护 早期 投资 的 回报 
fair Jette 

四 部/ 和 re 信 的 哈 二 

deett 

ra 维度 2 

nomm 长 期 收益 


vts tol t 
VERDURE PER 

糊 脖 数据 的 短期 再 和 
attico cic e 
期 定论 文 数据 的 可 用 性 


对 未 来 研究 人 员 和 学 生 的 价值 ; 
时 间 越 长 , 随 着 收集 量 和 临界 质量 的 
增加 ,价值 也 会 增加 


维度 3 
私人 收益 公共 收益 
对 研究 /存档 发 起 人 /资助 者 的 收益 。 ”为 未 来 研究 投入 
对 研究 人 员 的 收益 激励 新 的 研究 


履行 义务 
增长 可 见 性 /引用 
使 研究 商业 化 


直接 /间接 ,短期 /长 期 和 私人 /公众 三 个 收益 分 类 
维度 , 旨 在 帮助 机 构思 考 与 长 期 保存 科学 数据 有 关 的 
收益 ,以 便 更 好 地 评估 它们 对 于 管理 成 本 的 相对 权重 
显然 ,还 有 其 他 维度 可 以 添加 到 这 个 框架 中 ,需要 进行 
更 多 的 实践 和 研究 来 丰富 每 个 维度 中 的 收益 。 虽 然 这 
些 收益 中 的 许多 是 很 难 量化 的 ,在 某 些 情况 下 甚至 是 
不 可 能 的 ,然而 ,即使 只 是 通过 定性 的 方式 来 表达 收 
益 , 也 有 助 于 提高 资助 者 和 其 他 决策 者 的 意识 。 至 少 ， 


促进 新 公司 和 高 技能 就 业 / 职 业 


[s] 


98 


伦敦 国王 学 院 、 南 安 普 顿 大 学 等 。 本 文 总 结 了 这 些 
机 构 利用 KRDS 模型 开展 科学 数据 管理 成 本 分 析 的 
步骤 , 见 表 5。 

从 表 中 可 以 看 出 ,高 校 在 应 用 科学 数据 管理 作业 
成 本 模型 时 ,大致 都 分 为 以 下 几 步 :在 确定 具体 的 作业 
范围 文本 提交 格式 和 提交 协议 等 后 ,首先 明确 管理 过 
程 中 那些 会 对 成 本 产生 整体 性 影响 的 因素 ;之 后 结合 
自身 情况 应 用 和 改进 KRDS 作业 模型 ,按照 TRAC 77 
法 划分 成 本 或 直接 按照 资源 将 成 本 划分 为 人 力 成 本 和 
资产 成 本 ;最 后 分 析 和 预测 每 个 作业 活动 的 具体 成 本 。 
根据 各 个 高 校 科 学 数据 管理 成 本 — 收益 的 研究 情况 、 
代表 性 以 及 相关 数据 的 可 获得 性 ,选取 伦敦 国王 学 院 、 
剑桥 大 学 和 南安 普 顿 大 学 三 个 典型 的 案例 ,对 KRDS 
科学 数据 管理 成 本 - 收益 模型 的 应 用 进行 详细 分 析 。 
5.1 伦敦 国王 学 院 KRDS 成 本 模型 应 用 

该 案例 研究 基于 11 年 来 摄取 和 管理 复杂 科学 数 
据 集 和 e-Research Center 为 伦敦 国王 学 院 (King’”s Col- 
lege London ( KCL) ) 建立 科学 数据 管理 和 保存 的 经 验 。 
KCL 科学 数据 管理 被 包含 于 一 个 更 大 的 项 目 , 即 整合 
虚拟 研究 环境 ( Virtual Research Environment(VRE ) ) ， 
以 支持 e-Research 的 实践 和 运作 。 有 具体 成 本 分 析 步 又 
如 下 : 

(1) 分 析 一 般 管 理 问 题 。 在 开展 科学 数据 管理 成 
本 核算 之 前 ,KCL 根据 KRDS 成 本 驱动 因素 的 一 般 要 
素 列表 ,首先 明确 管理 过 程 中 那些 会 对 成 本 产生 整体 
性 影响 的 因素 。 如 首先 要 确定 3 个 关键 的 工作 范围 : 
KCL 科研 数据 的 内 容 和 质量 ; 旧 系 统 与 VRE 的 整合 ; 
VRE 的 用 户 需求 。 此 外 ,还 需要 考虑 该 项 工作 带 来 的 
其 他 问题 :除了 支持 自 里 的 科研 需求 之 外 ,学 院 应 当 对 
KCL 的 科学 数据 负 多 大 责任 ;数据 是 否 能 开放 获取 ;对 
更 大 的 科研 社区 负 什 么 责任 ;如 何 满足 与 开放 存 取 相 
关 的 额外 费用 ; 跨 学 科研 究 越 来 越 趋向 于 国际 合作 ， 
此 ,对 器 机 构 合 作 项 目 产 生 的 科学 数据 如 何 合理 分 配 
责任 ;如 何 满足 KCL 科学 数据 管理 和 保存 费用 ,以 及 
TRAC 是 否 能 提供 可 行 的 解决 方案 等 。 


/一 十 


ChinaXiv 合 作 期 


卫 军 朝 , FEE, 刘 盼 攀 . KRDS 科学 数据 管理 成 本 一 收益 模型 调研 与 分 析 []]. 图 书 情报 工作 ,2018 ,62(24) :93 - 103. 
X5 KRDS 模型 应 用 案例 
成 本 分 析 研究 案例 /机 构 /高 校 数据 管理 对 象 分 析 步 又 
伦敦 国王 学 院 高 校 数据 存储 库 ; 国家 数据 中 心 ;艺术 与 人 工 利用 KRDS 成 本 驱动 因素 的 一 般 要 素 列 表 ,分析 科 学 数据 管理 中 对 成 本 
文学 有 整体 性 影响 的 问题 ， 

2. 依据 KRDS 成 本 核算 框 保 和 TRAC 要 素 ,分 配 各 个 作业 阶段 的 成 本 ; 
3. 开展 具体 成 本 分 析 与 核算 。 

剑桥 大 学 高 校 数据 存储 库 ;化 学 ,社会 人 类 学 1. 利用 KRDS 成 本 驱动 因素 的 一 般 要 素 列表 ,分 析 科学 数据 管理 中 对 成 本 
有 整体 性 影响 的 问题 ;2. 依据 KRDS 作业 模型 ,识别 各 作业 活动 涉及 的 具 
体 人 员 , 基 于 此 分 析 人 力 成 本 ; 
3. 开展 具体 成 本 分 析 与 核算 。 

南安 普 顿 大 学 国家 数据 中 心 ;高 校 数据 存储 库 ;化 学 ,海洋 学 同上 

牛津 大 学 高 校 数据 存储 库 同上 

考古 数据 服务 中 心 国家 数据 中 心 ;考古 学 同上 

英国 数据 档案 国家 数据 中 心 ;社会 和 历史 学 同上 


收益 分 析 研 究 案例 /南安 普 顿 ”国家 数据 中 心 ;化 学 
大 学 ,国家 结晶 学 数据 服务 


英国 数据 档案 国家 数据 中 心 ;社会 和 历史 学 


(2) 应 用 KRDS 成 本 核算 框架 。 在 协商 确定 一 般 
管理 问题 后 ,KCL 科学 数据 管理 机 构 依据 KRDS 成 本 
ERER ,利用 TRAC 要 素 进 行 了 成 本 分 配 。 首 先 将 
KREIS 作业 模型 各 阶段 中 所 涉及 的 影响 成 本 的 要 素 划 
入 3: 直接 产生 ,直接 分 配 和 间接 三 个 类 目 。 该 机 构 在 
TÉ ctoto He Deli HRS DU E 
据 得 理 上 的 费用 ;直接 分 配 成 本 基于 管理 设备 的 全 部 
疆 济 成 本 ( Full Economic Cost(FEC ) ) [5] 。 按 照 TRAC 
的 狂 导 方针 ,所 有 的 成 本 都 是 直接 分 配 的 ,而 不 是 间接 
ES SEE 6. 

它 (3 ) 成 本 分 析 。KCL 科学 数据 管理 机 构 依据 自身 
情 襄 ,成 本 分 析 主 要 划分 为 人 力 成 本 、 硬 件 成 本 分 析 。 
ERORE) 为 归档 管理 人 员 ( 协 助 活动 ,薪资 
£ 45 000) , 半 职 系统 管理 员 ( 安装 和 管理 软 硬 件 , 全 职 
薪资 8 24 000) ,集合 专员 (制定 和 实施 管理 ,保存 科学 
数据 的 工作 流程 与 标准 ,薪资 £ 35 000) 。 硬 件 成 本 是 
在 2005 年 购买 的 东西 ,包含 15TB 的 存储 空间 一 个 磁 
带 库 和 一 个 允许 终端 用 户 访问 的 分 布 式 服务 器 。 
此 外 ,在 具体 的 实践 活动 中 还 要 考虑 到 设备 存储 容量 、 
组 织 卫 环境、 资助 者 的 需求 变化 等 带 来 的 影响 ,包括 
数据 集 和 存档 的 大 小 ,复杂 性 和 类 型 等 的 改变 ,并 且 要 
在 整个 实践 过 程 中 要 保证 对 设备 进行 持续 维护 和 及 时 
升级 。 

(4) 预测 数据 管理 成 本 。 预 测 基于 成 本 “峰值 "的 
概念 , 它 是 指 随 着 存档 的 扩大 ,需要 更 多 的 设备 和 存储 
容量 来 管理 不 断 增加 的 数据 量 ,因此 成 本 也 随时 间 而 
增加 。 类 似 的 , 随 着 存档 的 扩大 ,每 年 的 收集 数量 增 
加 ,从 而 需要 额外 的 工作 人 员 。 人 力 成 本 是 根据 收集 


1. 将 该 机 构 进行 科学 数据 管理 的 活动 划分 为 三 个 时 期 ; 
2. 进行 原始 数据 和 迁移 数据 的 成 本 分 析 ; 
3. 利用 KRDS 收益 分 析 框 架 进 行 收益 分 析 。 


同上 


人 员 每 年 处 理 30 个 集合 的 摄取 量 和 保存 情况 而 定 的 ， 
其 中 包含 10 个 “简单 ”的 集合 (标准 格式 和 元 数据 的 
图 像 或 文本 ) 和 20 个 复杂 的 集合 (图 像 .视频 以 及 相互 
链接 的 文档 等 ) ,其 中 ,员工 20% 的 时 间 还 会 用 于 一 般 
的 任务 “ ,例如 审查 和 更 新 许可 证 协议 ,标准 等 。 

5.2 ”剑桥 大 学 KRDS 成 本 模型 应 用 

剑桥 大 学 案例 研究 的 主要 对 象 是 DSpace Cam- 
bridge 和 Department of Chemistry' s Unilever Centre for 
Molecular Science Informatics, DSpace(? Cambridge 存储 
库 最 初 是 一 个 合作 项 目 , 从 2003 年 到 2006 年 由 剑桥 
-有 诬 省 理工 学 院 资助 ,主要 目标 是 建立 DSpace 软件 平 
台 , 使 它 作 为 剑桥 大 学 机 构 存储 库 ” 。 它 接受 各 种 格 
式 的 数字 内 容 , 主 要 是 包含 一 些 传 统 科研 出 版 物 的 
片 和 数据 。 现 含有 化 学 信息 学 、 考 古 学 和 人 类 学 田野 
调查 等 学 科 的 数据 。 其 成 本 核算 的 主要 步骤 为 : 

(1) 分 析 一 般 管理 问题 。 同 样 ,在 开展 科学 数据 管 
理 成 本 核算 之 前 ,剑桥 大 学 的 科学 数据 管理 机 构 根 据 
KRDS 成 本 驱动 因素 的 一 般 要 素 列 表 , 明 确 了 管理 过 程 
中 那些 会 产生 整体 性 影响 的 因素 。 在 确定 剑桥 数据 管 
理 的 中 长 期 成 本 时 ,首先 需要 考虑 一 些 重要 问题 :选择 
和 /或 评估 流程 ,创建 充足 的 元 数据 (需要 大 量 的 人 力 成 
本 ) ,支持 的 格式 /版 本 ,不 同 格式 的 保存 计划 ,真实 性 和 
可 用 性 需求 ,以 及 可 持续 性 等 。 此 外 ,还 要 考虑 到 要 雇 
佣 数 字 保 存 领 域 的 专家 来 协调 整个 保存 活动 的 费用 。 

(2) 应 用 KRDS 作业 模型 。 剑 桥 大 学 科学 数据 管 
理 机 构 依 据 KRDS 作业 模型 ,识别 各 作业 活动 涉及 的 
具体 人 员 ,在 此 基础 上 开展 的 成 本 分 析 主 要 集中 于 人 
力 成 本 分 析 。 详 细 描述 见 表 7。 
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表 6 伦敦 国王 学 院 KRDS 成 本 核算 框架 
作业 模型 TRAC 作业 模型 TRAC 作业 模型 TRAC 作业 模型 TRAC 作业 模型 TRAC 

预存 档 阶段 开展 直接 产生 协商 提交 协议 直接 产生 归档 存储 直接 产生 先 发 创 新 (制定 直接 分 配 支持 服务 管理 直接 分 配 
(项 目 设计 ;数据 推广 和 存储 帮助 ” 直 接 产 生 ”接收 摄取 的 数据 ， 直 接 分 配 团体 数据 标准 和 (日 常 行政 /综合 
管理 计划 ;基金 申 (与 项 目 直 ”提供 访问 副本 ; 最 佳 实践 ;共享 保 管理 ; 客户 账户 ; 
请 ; 项 目 实施 / 启 接 相关 ) 管理 存储 层级 ;更 存 系统 和 工具 ;与 行政 /管理 支持 ) 
动 ) 直接 分 配 换 介质 ;灾难 恢 供应 商 合作 ) 

(一 般 的 推 ” 复 ;误差 校 验 

广 和 支持 ) 
创建 (协商 知识 直接 产生 处 理 (向 存档 机 直接 分 配 长 期 保存 规划 直接 分 配 数据 管理 (管理 直接 分 配 公共 服务 (操作 直接 分 配 
产权 /许可 /伦理 ; 构 转移 ;销毁 ) (跟踪 指定 的 用 和 维护 数据 库 ; 执 系统 服务 ;网 络 服 
生成 科学 数据 ; 生 户 社区 ;跟踪 技术 行 查询 ; 生成 报 务 ; 网 络 安全 服 
成 描述 性 元 数据 ; 的 发 展 ;制定 保存 告 ;数据 库 更 新 ; 务 ; 软 件 许可 和 硬 
生成 用 户 文档 ; 战略 和 标准 ;制定 管理 和 维护 数据 件 维护 ; 物理 安 
发 定制 软件 ;数据 信息 包 策划 和 迁 库 ;执行 查询 ; 生 全 ;后 勤 ; 公共 事 
管理 ;生成 数据 存 移 计划 ;制定 和 监 成 报告 ;数据 库 更 WOKE); 物资 
档 包 ) 控 外 包 保 存 的 服 新 ) 库存 ) 

务 级 别 协议 ;进行 
-— 长 期 保存 ) 
gre 直接 分 配 摄取 (接收 提交 直接 产生 生成 保存 元 数据 ”直接 产生 访问 直接 分 配 物业 管理 直接 分 配 
数据 ;质量 检查 ; 检索 和 命令 ;交付 

P 生成 存档 信息 包 ; 响应 ;用 户 支持 ， 直接 产生 耗材 直接 分 配 
"SER CHR) 生成 管理 元 数据 ; 新 产品 生成 
e 生成 描述 性 元 数 生成 信息 包 发 给 差 旅 和 必须 品 。“” 直 接 产生 
e 据 和 用 户 文 档 用 户 


co 等 ) 
CG 表 7 剑桥 大 学 KRDS 成 本 核算 框架 


CN WB AB 时 间 
se ,保存 项 目 最 初 的 文件 和 数据 ,需要 相关 人 员 和 数据 项目 人 员 与 存储 库 管 理 员 和 系统 管理 员 协 ”每 个 项 目 需要 2 名 8 级 全 职员 工 花费 2 至 5 
方 就 存储 方法 、 格 式 等 方面 进行 协商 。 商 天 
~ 取决 于 各 种 因素 ,例如 格式 和 项 目 工作 人 员 
ma 对 于 DSpace 是 否 熟悉 
PU EL, OU eM PESCA 用 户 文档 是 资源 密集 型 的 任 高 校 研 究 服务 部 法 律 组 归于 间接 成 本 周期 性 
峰 3Wf 究 者 利用 指导 方针 和 专业 支持 进行 操作 ,元 数据 越 标准 — 联络 人 员 (6 级 ) 负责 元 数据 映射 一 次 性 工作 ,可 能 需要 重新 访问 
oes. 项 目 开始 的 1 -5 X 
s — 8 级 和 6 级 岗 


[: 


早期 


提交 方 来 完成 ; 扩 


化 。 


来 降低 成 本 的 阶段 ， 


阶段 ,需要 大 量 的 人 力 资源 ,但 


存档 存储 阶段 ,技术 发 有 
岂 会 花费 额外 费 


do 


展 支持 是 资源 密约 
确定 获取 的 数据 ,相关 文档 和 软件 
转移 阶段 ,数据 存档 在 高 校 和 
理 机 构 之 间 就 技术 和 法 律 层 
摄取 阶段 ,是 成 本 最 密集 的 阶段 ,但 


Li 


ü 


DSpace 把 选择 内 容 的 工作 


交 条 款 意 见 


高 校 法 律 小 组 就 提 


是 很 重要 
部 管理 机 构 之 
进行 协商 并 统一 


取决 于 采 


型 的 ,在 


也 是 最 有 可 能 


生命 周期 的 
的 。 


间 转 移 , 需 要 管 
标准 。 


通过 自动 化 


的 摄取 方法 和 


是 否 采用 自动 


下 


保存 规划 ,该 阶段 要 制定 数字 
占 其 长 期 价值 格式 和 


先 发 创 新 


相关 数据 来 源 : 剑 桥 大 学 科研 数据 管理 习 
剑桥 大 学 数据 管理 机 构 在 进行 成 本 
核算 时 ,所 涵盖 的 成 本 数据 ”主要 分 为 以 下 几 个 方面 

* DSpace 9? Cambridge 的 工作 人 员 。DSpace @ 
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(3) 成 本 分 析 。 


风险 等 ， 


是 影响 该 成 本 的 


资料 生 


关键 


命 周 


*- 


确保 其 长 "E 


Ho 


因素 ,异地 存储 


理 规 划 ,定期 评 


存储 库 经 理 (8 级 ) 和 支持 及 联络 人 员 (6 


级 ) 


存储 库 经 理 和 系统 管理 员 制 定 转移 计划 以 


及 每 年 维护 计划 
DSpace 系统 管理 人 员 (8 级 ) 摄取 数 据 
DSpace 系统 经 理 和 开发 人 员 集 成 区 
管理 系统 


像 内 


标准 条 款 


(一 次 性 的 ) + 额外 的 关于 具体 内 


容 和 使 用 的 谈判 (周期 性 ) ,需要 5 天 
>20% 的 持续 工作 


作为 JISC 资助 项 目的 一 部 分 进行 集成 


数字 化 及 数字 保存 专家 (8 级 ) 与 DSpace 小 


组 共同 负责 
存储 库 经 理 
DSpace 发 人 员 


FE http://www. data. cam. ac. uk/repository 


Cambridge 团队 (3 Z 8 级 全 职 岗 员工 ;1 44 6 级 全 职 岗 
员工 ) ;数字 化 和 数字 保存 专家 (8 级 全 职 岗 ) 。 
具体 的 薪资 核算 方法 。 


有 指出 上 


一 次 性 转移 

10% 的 持续 工作 

2 名 8 级 岗 工 作 3 个 月 

3 年 以 上 的 & 300000 项 目 资助 


但 并 没 


Chinay i" M/EBBTII 
C hinaXIVer TERHT | 


卫 军 朝 , REGE, AM. KRDS 科学 数据 管理 成 本 - 收益 模型 调研 与 分 析 [J]. 图 书 情报 工作 ,2018 ,62(24):93 - 103. 


e 硬件 投资 ,DSpace @ Cambridge 投资 了 大 的 
150TB 的 镜像 存储 ,成 本 约 为 2 176,293.82, 
5.3 ”南安 普 顿 大 学 成 本 -收益 模型 应 用 

这 个 关于 科学 数据 管理 收益 分 析 的 案例 研究 ,是 
基于 南安 普 顿 大 学 化 学 系 所 拥有 的 纵向 成 本 信息 。 案 
例 包 含 了 KRDS 模型 中 预存 档 和 存档 阶段 的 几 个 主要 
作业 :开展 项 目 设 计 和 数据 管理 计划 ;创建 描述 性 元 数 
据 ,数据 管理 和 生成 数据 存档 包 ; 数 据 选择 和 存储 文 
持 ; 向 其 他 机 构 转 移 和 销毁 数据 以 及 接收 数据 提交 包 
等 。 具 体 步 又 如 下 : 

(1) 划 分 时 期 。 该 案例 是 关于 保存 (原始 存储 格 
式 ) 和 迁移 (新 存储 格式 ) 成 本 的 比较 研究 ,数据 来 自 


表 8 南安 普 顿 大 学 KRDS 收益 分 析 框 架 
维度 1 
直接 收益 间接 收益 ( 避免 成 本 ) 
因为 实施 正确 和 有 用 的 元 数据 保 ”早期 投资 的 保护 
在 ,提高 科研 生产 力 ; 
将 知识 转移 到 后 继 学 者 上 ; 
对 知识 体系 有 更 大 贡献 ; 
知识 转移 导致 商业 化 的 发 现 增加 ; 
履行 出 资 人 授权 的 工作 


维度 2 
短期 收益 长 期 收益 
对 研究 者 : 保存 禁 运 或 未 公布 的 数据 ( 目前 佑 


在 分 析 过 程 中 恢复 原始 数据 的 能 。 计 约 占 研究 产 出 的 80% ) 291, 


国家 结晶 学 服务 ,时 间 跨 度 为 1970 - 2009 年 ,在 此 其 
间 s 实 验 仪器 .计算 能 力 和 数据 存储 介质 (例如 : 纸 , 数 
视频 光盘 等 ) 已 经 彻底 改变 。 考 虑 到 这 些 变化 的 因 
素 5 该 机 构 以 技术 之 间 进行 转换 为 依据 ,例如 :个 人 计 
算 帝 的 引入 ,新 一 代 的 仪器 ,或 者 在 线 存储 的 出 现 ,将 
管理 活动 大 致 分 为 三 个 时 期 (1970 - 1990 ,1990 - 2000 
和 ;2000 - 至 今 )20 。 
(2) 成 本 分 析 。 南 安 普 顿 大 学 数据 管理 机 构 的 成 
> 分 析 主 要 集中 在 保存 成 本 和 迁移 成 本 方面 。 国 家 结 
串 物 服务 的 实验 结果 是 一 个 晶体 结构 , 它 是 收集 原始 
实验 数据 (Raw Data) 的 产物 ,并 将 其 加 工 成 结果 数据 
(Re&ult Data) 。 需 要 注意 ,实验 室 使 用 当前 设备 生成 
PRAISE nde dt 328 ,然而 在 1970 年 到 1990 年 间 
重 句 创建 一 个 结构 的 成 本 大 约 是 六 十 倍 。 最 明显 的 
是 3 管理 原始 数据 的 成 本 约 为 总 数据 (原始 + 结果 ) 管 
HAS 7006 加 。 因 此 ,对 原始 数据 的 管理 ,而 不 是 
结果 数据 ,是 晶体 结构 数据 管理 的 重要 环节 。 

(3) 收益 分 析 。 该 案例 研究 强调 的 收益 与 KRDS 收 
益 分 析 框架 相 一 致 , 见 表 8。 之 后 便 根据 表 中 得 出 的 具 
体 收益 ,在 KRDS 作业 模型 上 详细 叙述 每 个 活动 相对 应 
的 收益 ,确定 收益 类 型 .利益 相关 者 以 及 收益 实现 年 限 ， 
设 定 收益 影响 权重 ,从 而 形成 一 套 完整 的 价值 链 。 


6 ”对 我 国 开展 科学 数据 管理 成 本 -收益 


分 析 的 启示 

第 四 范式 正在 兴起 ,为 保障 以 数据 为 驱动 的 研究 
能 顺利 进行 ,对 科学 数据 的 管理 已 成 为 关键 的 研究 和 
实践 领域 ,在 该 管理 活动 中 首要 解决 的 是 成 本 问题 。 
国外 高 校 在 进行 科学 数据 管理 时 ,都 会 先 确 定 管理 阶 
段 和 作业 , 据 此 分 析 管 理 成 本 ,为 进一步 管理 活动 做 投 
资 预算 与 方案 准备 。 


力 ; 在 收集 并 使 其 公开 之 后 ,恢复 精确 数 
在 传播 的 早期 阶段 为 原始 数据 提 — 据 要 便宜 很 多 ; 
供 来 源 链 的 能 力 ; 用 下 一 代 软 件 重新 解释 数据 的 能 力 
提高 了 研究 成 果 的 可 见 度 
维度 3 

私人 收益 公共 收益 
能 够 为 未 来 管理 个 人 研究 数据 ,以 增加 资金 价值 ; 
便 今后 可 以 利用 增加 知识 转移 ; 

增长 可 用 于 挖掘 和 新 科学 的 数据 体系 


内 一 些 高 校 也 渐渐 开始 重视 科学 数据 管理 , 复 
且 大 学 于 2011 年 成 立 了 人 文 社 会 科学 数据 中 心 ,通过 
这 一 跨 部 门 .多 学 科 联 合 机 构 的 设立 ,该 校 人 文 社会 科 
学 数据 资源 能 够 实现 集中 建设 整体 规划 ,统一 管理 和 
充分 共享 ” ,2013 年 复旦 大 学 与 哈佛 大 学 Dataverse 
Network 系统 签署 了 全 面 合作 协议 ,进行 引进 和 二 
次 开发 ,搭建 了 复旦 大 学 社会 科学 数据 平台 ,可 以 免费 
注册 并 上 传 、 下 载 相 关 数 据 集 ;2014 年 ,北京 大 学 图 书 
馆 开始 对 “研究 数据 管理 平台 ”进行 前 期 调研 和 平台 
选 型 ,最 后 同样 基于 哈佛 大 学 Dataverse 系统 搭建 了 开 
放 研 究 数 据 平台 ,并 可 供 校内 外 用 户 进 行 数据 集 的 
免费 上 传 和 下 载 . 共 享 等 服务 。 国 内 高 校 虽然 都 在 搭 
建 数据 中 心 , 但 几乎 都 是 基于 国外 成 熟 的 系统 进行 二 
次 开发 , 现 多 为 免费 服务 , 且 没 有 明确 和 详细 的 数据 提 
交流 程 和 成 本 核算 模型 与 规定 ,关于 科学 数据 管理 成 
本 -收益 方面 的 研究 和 实践 依然 不 够 全 面 和 完善 。 从 
以 上 模型 研究 和 案例 分 析 来 看 ,我 国 在 开展 科学 数据 
管理 成 本 - 收益 分 析 时 ,应 注意 以 下 几 个 事项 : 
6.1 明确 科学 数据 管理 流程 
根据 国内 数据 平台 目前 的 现状 ,在 进行 科学 数据 
管理 时 ,应 该 首先 明确 科学 数据 管理 流程 ,提前 制定 数 
据 管理 规划 ;规定 数据 提交 格式 和 提交 协议 ,明确 管理 
过 程 中 那些 会 对 成 本 产生 整体 性 影响 的 因素 等 ;确定 
数据 收集 和 开放 等 级 ,保存 目标 ;并 且 要 特别 关注 工作 
负载 量 和 进程 时 间 ,确保 员工 能 够 及 时 适应 存储 量 的 
变化 和 工作 负荷 的 波动 。 经 研究 发 现 ,通过 多 个 机 构 
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图 二 情报 三 作 
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合作 建立 科学 数据 管理 中 心 ,联合 开发 软件 .追踪 技术 
发 展 .制订 数据 管理 计划 .共享 协议 等 ,将 会 极 大 降低 


项 目 , 而 我 国 就 图 书 情报 专业 来 说 ,还 未 曾 有 与 科学 数 
据 管理 相关 的 课程 ,科学 数据 管理 人 才 的 培养 已 经 迫 


管理 成 本 ,提高 数据 共享 效率 。 复 日 大 学 .北京 大 学 在 
建立 其 科学 数据 中 心 时 ,都 调研 和 联合 了 多 个 部 分 和 
研究 机 构 ,但 也 仅仅 是 在 本 校 范围 ,最 多 辐射 当地 的 部 
分 其 他 高 校 ,规模 效应 还 不 够 大 ;在 其 平台 运行 过 程 
中 ,没有 明确 的 数据 提交 协议 和 管理 流程 ,这 将 会 对 保 
存 成 本 和 收益 分 析 造 成 很 大 的 困难 。 
6.2 ”应 用 成 熟 的 成 本 分 析 模型 

目前 ,国内 的 科学 数据 中 心 并 没有 制订 出 规范 的 
成 本 分 析 模 型 ,也 没有 很 好 的 借鉴 和 改进 国外 成 熟 的 
成 本 - 收益 分 析 模型 ;各 个 科学 数据 管理 机 构 在 开展 
成 本 分 析 时 间 题 不 断 ,缺乏 清晰 的 作业 阶段 划分 ,活动 
识别 ,成 本 驱动 因素 识别 不 当 等 。 因 此 ,科学 数据 管理 
袖 本 或 数据 中 心 应 结合 身 情况 ,构建 .改进 和 应 用 国 
TUA EU HUS, 如 KRDS MAEA ERN A 
Iri AAWL ENES) o t PERGEPEOI BR 
PREES sh EK AME ep n d 
因 潭 ,涉及 数据 格式 ,数据 量 , 用 户 量 等 变量 。 其 后 ,将 
人 了 活动 与 驱动 因素 连结 起 来 ,形成 规范 的 本 地 化 的 
三 分 析 模 理 , 改 善 国内 科学 数据 中 心 的 成 本 分 析 现 


内 高 校 已 搭建 的 科学 数据 管理 平台 现 均 处 于 免 
列 及 务 阶段 ,用 户 在 提交 、 下 载 与 共享 数据 时 ,没有 明 
晰 祖 收 费 协议 ,平台 内 部 也 没有 公布 相关 的 成 本 核算 
步骤 和 方法 ,财务 核算 和 平台 服务 相互 分 离 ,容易 造成 
部 好 成 本 的 缺失 或 重复 核算 。 平 台 的 科学 数据 管理 成 
本 核算 应 由 相关 技术 人 员 和 财务 人 员 协 作 开展 ,该 阶 
段 首 先 要 明确 各 个 作业 活动 的 成 本 类 别 。 经 案例 研究 
发 现 ,一 般 国外 的 科学 数据 管理 机 构 按 照 两 种 方式 来 
划分 成 本 ,一 种 根据 TRAC 方法 ,将 活动 阶段 的 成 本 划 
分 为 直接 产生 或 直接 分 配 ; 另 一 种 是 直接 按照 消耗 的 
资源 类 型 划分 ,通常 分 为 人 力 成 本 和 资产 资本 ,这 种 方 
式 需要 管理 机 构 确定 各 个 活动 阶段 所 需 的 员工 类 型 和 


级 别 。 要 注意 ,在 开展 成 本 核算 时 ,要 考虑 经 济 调 整 类 
的 变量 对 资源 和 资产 产生 的 影响 ,这 将 在 很 大 程度 影 


响 整 体 成 本 。 

6.4 注重 科学 数据 管理 人 才 的 培养 及 实现 自动 化 
从 科学 数据 管理 费用 来 看 , 人员 支 出 占 到 了 科学 

数据 管理 费用 的 大 部 分 ,在 一 些 领 域 , 甚 至 达到 90% 。 

可 见 , 科 学 数据 管理 人 才 是 数据 管理 的 关键 因素 。 

外 非常 重视 此 类 人 才 的 培育 ,已 成 功 实施 了 许多 培育 
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在 眉 睫 。 此 外 ,从 数据 保存 作业 的 角度 来 看 ,数据 摄取 
及 其 之 前 管理 活动 的 人 力 成 本 占 55 左右。 然而 实 
现 高 度 自动 化 的 操作 ,可 以 大 大 降低 该 部 分 人 力 成 本 。 
科学 数据 管理 机 构 应 当 实 时 跟踪 技术 的 发 展 ,及 时 更 


新 软 硬 件 ,以 保证 高 效 的 数据 摄取 和 管理 工作 ,降低 管 
理 成 本 。 
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Abstract. [ Purpose/significance | With the fourth paradigm of data -intensive scientific discovery emerging, re- 


search data management has been an important prerequisite for data-intensive scientific discovery. By the survey of Keep- 


ing Research Data Safe model, this paper aims to provide a reference for the research data management in China. [ Meth- 


od/process | This paper analyzed the JISC -funded Keeping Research Data Safe ( KRDS) and the KRDS -based practice of 


overseas universities by literature research and Web-based survey , then analyzed the characteristics , steps and experiences 


and lessons learned of research data management cost analysis based on KRDS. Finally, it proposed specific measures for 


research data management cost analysis in China. 


[ Result/conclusion | KRDS model is a 


universal and systematical 


framework. It can fully involve and predict the key cost of each activity. KRDS could provide a direction, standardize the 


management process, and refine management costs and benefits in China. 
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